6 muestras de células mononucleares (CD45+) de lámina propia de intestino delgado de ratón.
Se analizaron dos cepas de ratón:
Wiltype (WT) (n = 3)
IgA knockout (IgA-KO) (n = 3)
Análisis single-cell RNA-seq:
Procesamiento de datos: Cell ranger v.6.1
Genoma de referencia: refdata-gex-mm10-2020-A
Análisis de los datos: paquete de R Seurat v5.
| Sample | Strain | Cells | nCount_mean | nCount_min | nCount_max | nFeature_mean | nFeature_min | nFeature_max |
|---|---|---|---|---|---|---|---|---|
| 11_IgAKO | IgAKO | 6845 | 3077.177 | 500 | 158902 | 979.8203 | 200 | 5939 |
| 2_IgAKO | IgAKO | 1995 | 4469.529 | 500 | 46489 | 1321.3243 | 206 | 5588 |
| 8_IgAKO | IgAKO | 7430 | 4015.943 | 500 | 67754 | 1100.2750 | 204 | 6342 |
| 13_WT | WT | 6920 | 3186.953 | 499 | 76629 | 1114.0805 | 201 | 6771 |
| 14_WT | WT | 9787 | 3575.914 | 502 | 55093 | 1214.2241 | 213 | 6241 |
| 7_WT | WT | 9139 | 4553.522 | 487 | 65523 | 1115.5712 | 202 | 5665 |
| Sample | Strain | Cells | nCount_mean | nCount_min | nCount_max | nFeature_mean | nFeature_min | nFeature_max |
|---|---|---|---|---|---|---|---|---|
| 11_IgAKO | IgAKO | 6184 | 3119.209 | 500 | 51313 | 999.9712 | 220 | 4810 |
| 2_IgAKO | IgAKO | 1145 | 5801.045 | 501 | 43541 | 1486.2236 | 206 | 4943 |
| 8_IgAKO | IgAKO | 6817 | 4079.613 | 500 | 55955 | 1126.7964 | 208 | 4956 |
| 13_WT | WT | 6721 | 3183.038 | 499 | 54735 | 1121.2285 | 201 | 4914 |
| 14_WT | WT | 9604 | 3493.390 | 502 | 41431 | 1207.3095 | 251 | 4990 |
| 7_WT | WT | 8314 | 4866.712 | 487 | 65523 | 1166.5345 | 218 | 4985 |
Los diferentes dataset en formato de objeto Seurat se sometieron a un merging y a una normalización mediante el método SCTransform.
Luego, antes de proceder a la integración de los datasets, se realizó una reducción de dimensiones de los datos mediante Principal Component Analysis (PCA), del cual se seleccionaron algunas dimensiones para los análisis subsecuentes tomando como base el Elbow plot del PCA (ver apartado 3.1).
La integración de los datos se realizó siguiendo tres métodos diferentes: Harmony, CCA y RPCA. Se realizó una reducción visual de los datos mediante UMAP antes y después de las distintas integraciones para ofrecer una representación preliminar de un posible clustering de los datos (la resolución óptima se estudiará más adelante).
Finalmente, se eligió la integración mediante el método Harmony para realizar los análisis consecuentes.
La expresión del gen Malat1 se ha asociado a la presencia/ausencia de intrones en datasets de expresión, y el estudio de su nivel de expresión se ha propuesto como medida adicional de calidad.
En este caso, nos basaremos en el estudio de Monstserrat Ayuso y Esteve-Codina y reflejaremos las células divididas en tres grupos: a) “cells” (expresión normalizada de Malat1 esperable, entre 0 y 3.5), b) Cytosolic debris (expresión de 0), y c) Nuclei enriched (expresión >3.5).
Las células con 0 counts aparecen destacadas en azul.